智能论文笔记

Bayesian Optimization for Macro Placement

Changyong Oh , Roberto Bondesan , Dana Kianfar , Rehan Ahmed , Rishubh Khurana , Payal Agarwal , Romain Lepert , Mysore Sriram , Max Welling

分类：机器学习

2022-07-18

宏位置是将内存块放在芯片画布上的问题。它可以在序列对上表达为组合优化问题，该表示形式描述了宏的相对位置。解决此问题尤其具有挑战性，因为目标功能评估昂贵。在本文中，我们通过序列对使用贝叶斯优化（BO）开发了一种新颖的方法来宏观放置。 BO是一种机器学习技术，它使用概率的替代模型和一个采集功能，可以平衡探索和开发以有效地优化黑盒目标函数。 BO比强化学习更有效率，因此可以与更现实的目标一起使用。此外，从数据中学习并将算法适应目标函数的能力使BO成为其他黑盒优化方法（例如模拟退火）的吸引人替代方法，该方法依赖于问题依赖性的启发式方法和参数调整。我们在固定外线宏观位置问题上基准了我们的算法，并具有半二级线长度目标，并表现出竞争性能。

translated by 谷歌翻译

BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video

Ali Athar , Jonathon Luiten , Paul Voigtlaender , Tarasha Khurana , Achal Dave , Bastian Leibe , Deva Ramanan

分类：计算机视觉

2022-09-25

多个现有基准测试涉及视频中的跟踪和分割对象，例如，视频对象细分（VOS）和多对象跟踪和分割（MOTS）（MOTS），但是由于使用不同的基准标准数据集和指标，它们之间几乎没有相互作用（例如J＆F，J＆F，J＆F，J＆F，地图，smotsa）。结果，已发表的作品通常针对特定的基准，并且不容易相互媲美。我们认为，可以解决多个任务的广义方法的发展需要在这些研究子社区中更大的凝聚力。在本文中，我们旨在通过提出爆发来促进这一点，该数据集包含数千个带有高质量对象掩码的视频，以及一个相关的基准标准，其中包含六个任务，涉及视频中的对象跟踪和细分。使用相同的数据和可比较的指标对所有任务进行评估，这使研究人员能够一致考虑它们，因此更有效地从不同任务的不同方法中汇集了知识。此外，我们为所有任务展示了几个基线，并证明可以将一个任务的方法应用于另一个任务，并具有可量化且可解释的性能差异。数据集注释和评估代码可在以下网址获得：https：//github.com/ali2500/burst-benchmark。

translated by 谷歌翻译

Will It Blend? Mixing Training Paradigms & Prompting for Argument Quality Prediction

Michiel van der Meer , Myrthe Reuver , Urja Khurana , Lea Krause , Selene Báez Santamaría

分类：自然语言处理 | 人工智能

2022-09-19

本文描述了我们对第9届论证挖掘研讨会共同任务的贡献（2022）。我们的方法使用大型语言模型来进行论证质量预测的任务。我们使用GPT-3进行及时的工程，并研究培训范式多任务学习，对比度学习和中任务培训。我们发现混合预测设置优于单个模型。提示GPT-3最适合预测论点有效性，而论证新颖性最好通过使用所有三个训练范式训练的模型来估算。

translated by 谷歌翻译

Hierarchical Semantic Regularization of Latent Spaces in StyleGANs

Tejan Karmali , Rishubh Parihar , Susmit Agrawal , Harsh Rangwani , Varun Jampani , Maneesh Singh , R. Venkatesh Babu

分类：计算机视觉

2022-08-07

GAN的进展使高分辨率的感性质量形象产生了产生。 stylegans允许通过数学操作对W/W+空间中的潜在样式向量进行数学操作进行引人入胜的属性修改，从而有效调节生成器的丰富层次结构表示。最近，此类操作已被推广到原始StyleGan纸中的属性交换之外，以包括插值。尽管StyleGans有许多重大改进，但仍被认为会产生不自然的图像。生成的图像的质量基于两个假设。（a）生成器学到的层次表示的丰富性，以及（b）样式空间的线性和平滑度。在这项工作中，我们提出了一个层次的语义正常化程序（HSR），该层次正常化程序将生成器学到的层次表示与大量数据学到的相应的强大功能保持一致。 HSR不仅可以改善发电机的表示，还可以改善潜在风格空间的线性和平滑度，从而导致产生更自然的样式编辑的图像。为了证明线性改善，我们提出了一种新型的度量 - 属性线性评分（ALS）。通过改善感知路径长度（PPL）度量的改善，在不同的标准数据集中平均16.19％的不自然图像的生成显着降低，同时改善了属性编辑任务中属性变化的线性变化。

translated by 谷歌翻译

Everything is There in Latent Space: Attribute Editing and Attribute Style Manipulation by StyleGAN Latent Space Exploration

Rishubh Parihar , Ankit Dhiman , Tejan Karmali , R. Venkatesh Babu

分类：计算机视觉 | 人工智能

2022-07-20

现在，使用最近的生成对抗网络（GAN）可以使用高现实主义的不受约束图像产生。但是，用给定的一组属性生成图像非常具有挑战性。最近的方法使用基于样式的GAN模型来执行图像编辑，通过利用发电机层中存在的语义层次结构。我们提出了一些基于潜在的属性操纵和编辑（火焰），这是一个简单而有效的框架，可通过潜在空间操纵执行高度控制的图像编辑。具体而言，我们估计了控制生成图像中语义属性的潜在空间（预训练样式的）中的线性方向。与以前的方法相反，这些方法依赖于大规模属性标记的数据集或属性分类器，而火焰则使用一些策划的图像对的最小监督来估算删除的编辑指示。火焰可以在保留身份的同时，在各种图像集上同时进行高精度和顺序编辑。此外，我们提出了一项新颖的属性样式操纵任务，以生成各种样式的眼镜和头发等属性。我们首先编码相同身份的一组合成图像，但在潜在空间中具有不同的属性样式，以估计属性样式歧管。从该歧管中采样新的潜在将导致生成图像中的新属性样式。我们提出了一种新颖的抽样方法，以从歧管中采样潜在的样品，使我们能够生成各种属性样式，而不是训练集中存在的样式。火焰可以以分离的方式生成多种属性样式。我们通过广泛的定性和定量比较来说明火焰与先前的图像编辑方法相对于先前的图像编辑方法的卓越性能。火焰在多个数据集（例如汽车和教堂）上也很好地概括了。

translated by 谷歌翻译

Hate Speech Criteria: A Modular Approach to Task-Specific Hate Speech Definitions

Urja Khurana , Ivar Vermeulen , Eric Nalisnick , Marloes van Noorloos , Antske Fokkens

分类：自然语言处理

2022-06-30

\ textbf {攻击性内容警告}：本文仅包含进攻性语言，仅用于提供阐明这项研究的示例，并且不反映作者的意见。请注意，这些例子是令人反感的，可能会导致您困扰。识别\ textit {仇恨言语}的主观性使其成为一项复杂的任务。 NLP中的不同和不完整的定义也反映了这一点。我们提出\ textit {仇恨言论}标准，以法律和社会科学的观点开发，目的是帮助研究人员创建有关五个方面的更精确的定义和注释指南：（1）目标群体，（2）优势，（3）（3）肇事者特征，（4）否定组参考的类型和（5）潜在后果/效果的类型。可以对定义进行构建，从而涵盖更广泛或更狭窄的现象。因此，可以在指定标准或使其打开的情况下做出有意识的选择。我们认为，目标开发人员的目标和确切的任务应确定\ textit {仇恨言语}的范围的定义。我们从\ url {hatespeechdata.com}概述了英语数据集的属性，该属性可能有助于为特定方案选择最合适的数据集。

translated by 谷歌翻译

Multilingual Event Linking to Wikidata

Adithya Pratapa , Rishubh Gupta , Teruko Mitamura

分类：自然语言处理

2022-04-13

我们提出了将事件链接到知识库的多语言链接的任务。我们会自动编译一个针对此任务的大型数据集，包括180万个涉及Wikidata超过10.9k事件的44种语言提及。我们提出了事件链接任务的两个变体：1）多语言，其中事件描述来自与提及的语言相同的语言，以及2）交叉语言，其中所有事件描述均以英语为单位。在提出的两个任务上，我们比较了包括BM25+（LV和Zhai，2011年）在内的多个事件链接系统以及Blink（Wu等，2020）的Biencoder和Crossencoder体系结构的多语言改编。在我们对两个任务变体的实验中，我们发现Biencoder和Crossencoder模型均显着优于BM25+基线。我们的结果还表明，跨语言任务通常比多语言任务更具挑战性。为了测试所提出的链接系统的室外概括，我们还创建了基于Wikinews的评估集。我们提出了定性分析，强调了拟议数据集捕获的各个方面，包括需要在上下文上进行时间推理并解决跨语言的各种事件描述。

translated by 谷歌翻译

An Artificial Intelligence Dataset for Solar Energy Locations in India

Anthony Ortiz , Dhaval Negandhi , Sagar R Mysorekar , Joseph Kiesecker , Shivaprakash K Nagaraju , Caleb Robinson , Priyal Bhatia , Aditi Khurana , Jane Wang , Felipe Oviedo

分类：机器学习

2022-01-31

可再生能源的快速开发，尤其是太阳能光伏（PV），对于缓解气候变化至关重要。结果，印度设定了雄心勃勃的目标，可以在2030年之前安装500吉瓦的太阳能容量。鉴于预计大量的足迹可以满足可再生能源能源目标，因此对环境价值的土地利用冲突的潜力很高。为了加快太阳能的发展，土地使用计划者将需要访问PV基础设施的最新，准确的地理空间信息。在这项工作中，我们开发了一种露骨的机器学习模型，以使用自由使用的卫星图像绘制印度的公用事业规模的太阳能项目，平均准确性为92％。我们的模型预测得到了人类专家的验证，以获取1363个太阳能光伏农场的数据集。使用此数据集，我们测量了整个印度的太阳足迹，并量化了与PV基础设施发展相关的土地盖修改程度。我们的分析表明，印度超过74％的太阳能发展是建立在具有自然生态系统保护或农业价值的陆生类型上的。

translated by 谷歌翻译

Machine Learning: Algorithms, Models, and Applications

Jaydip Sen , Sidra Mehtab , Rajdeep Sen , Abhishek Dutta , Pooja Kherwa , Saheel Ahmed , Pranay Berry , Sahil Khurana , Sonali Singh , David W. W Cadotte

分类：机器学习 | 人工智能

2022-01-06

近期目睹了机器学习算法系统的快速发展，尤其是加强学习，自然语言处理，计算机和机器人视觉，图像处理，语音和情感处理和理解。凭借机器学习模型，算法及其应用的越来越重要和相关性，并且随着更多创新使用的深度学习和人工智能的情况，目前的体积呈现出一些创新研究工作及其在现实世界中的应用，如股票交易，医疗和医疗保健系统和软件自动化。本书中的章节说明了如何设计，优化和部署机器学习和深度学习算法和模型。该体积对于高级毕业生和博士生，研究人员，大学教师，练习数据科学家和数据工程师，专业人士和顾问以及在机器学习，深度学习和人工智能的广泛领域。

translated by 谷歌翻译

Unsupervised Adaptation of Semantic Segmentation Models without Source Data

Sujoy Paul , Ansh Khurana , Gaurav Aggarwal

分类：计算机视觉

2021-12-04

我们考虑了源模型的无监督域适应的新问题，而无需访问语义分段的源数据。无监督的域适配旨在使标记为源数据的模型调整到新的未标记目标数据集。现有方法假设源数据在自适应期间与目标数据一起使用。但是，在实际情况下，由于在本工作中的原因，我们只能访问源模型和未标记的目标数据，但不是标记的来源，我们提出了一种自我训练方法从源模型中提取知识。要弥补从源到目标的分发班次，我们首先使用未标记的目标数据更新网络的标准化参数。然后我们采用信心过滤的伪标签，并强制执行某些转换。尽管非常简单直观，但我们的框架能够在我们广泛的实验和消融研究中直接应用于目标数据的源模型来实现显着的性能。事实上，性能只是几个远离最近的最先进的方法，它使用源数据进行适应。我们进一步展示了完全测试时间适应设置的所提出方法的恒定性，在那里我们不需要任何目标培训数据并仅在测试时适应。

translated by 谷歌翻译